<html lang="ru"><head><meta content="text/html; charset=utf-8" http-equiv="Content-Type"> <link rel="stylesheet" href="http://www.google.com/google.css"> <link rel="stylesheet" href="../leftnav.css"> <style>
<!--
body,td,font,p,a{font-family:arial,sans-serif}
.i { margin-left: 1em; margin-right: 2em; }
//.style1 {font-weight: bold}
.style1 {font-weight: bold}
.d {color:#999999;text-decoration:italics;font-size:10px;}
.changes {color: #FF0000}
-->
</style> <script src=" https://ssl.google-analytics.com/urchin.js " type="text/javascript">
</script> <script type="text/javascript">
  _uacct="UA-18009-2";
  _utcp="/webmasters/sitemaps/";
  _uanchor=1; 
  urchinTracker();
</script>  <title>Инструменты Google для веб-мастеров</title> </head> <body class="search" bgcolor="#ffffff" text="#000000" link="#0000CC" vlink="#800080" alink="#ff0000" topmargin="3"> <table width="95%" border="0" cellpadding="0" cellspacing="2">  <tr valign="top">  <td width="1%"><a href="https://www.google.com/webmasters/sitemaps/"> <img src="http://www.google.com/images/google_sm.gif" hspace="15" height="59" width="143" vspace="5" alt="Вернуться на главную страницу Google." border="0"></a></td>  <td width="100%" valign="middle">  <table width="100%" border="0" cellspacing="0" cellpadding="0">  <tr>  <td><font size="+0"><b>Инструменты для веб-мастеров</b></font></td>  </tr>  <tr>  <td style="border-bottom:1px solid #999999" height="1"><img width="1" height="1" alt=""></td>  </tr>  </table>  </td>  </tr> </table> <table border="0" cellpadding="2" cellspacing="0" width="95%">  <tr>  <td width="175" valign="top">  <font size="-1">  <p class="sidenavlink"><a href="about.html">Об инструментах для веб-мастеров</a></p>  <p class="sidenavlink"><a href="protocol.html">Использование протокола Sitemap</a></span><p class="sidenavtoc">Использование Sitemap Generator</p> <p class="sidenavlink"><a href="http://www.google.com/webmasters/">Центр веб-мастеров Google</a></p>  </font></td>  <td background="http://www.google.com/images/dot2.gif" valign="bottom" width="5"><img src="http://www.google.com/images/dot2.gif" width="1" height="1"></td>  <td style="background-color: #ffffff" width="10" valign="top"><img src="http://www.google.com/images/cleardot.gif" width="10" height="1"></td>  <td>  <div class="content">   <p><strong>Содержание</strong></p>  <p><font size="-1"><a href="#before">Перед началом работы</a><br><a href="#download">Загрузка файлов программы Sitemap Generator</a><br><a href="#config">Создание файла конфигурации</a><br><a href="#copy">Загрузка файлов на Ваш веб-сервер</a><br><a href="#execute">Запуск скрипта Sitemap Generator</a><br><a href="#submitting">Отправка Вашего Sitemap в Google</a><br><a href="#troubleshoot">Разрешение проблем</a>  </font></p>  <table border="0" cellpadding="2" cellspacing="0" width="100%">  <tbody><tr>  <td style="border-top: 1px solid rgb(221, 173, 8); background-color: rgb(254, 250, 222);"><a name="before"></a><b>Перед началом работы</b></td>  </tr>  </tbody></table>  <p><font size="-1">Google Sitemap Generator — это скрипт на языке Python, который создает Sitemap для Вашего сайта на основе протокола Sitemap. Этот скрипт может создавать файлы Sitemap из списков URL, каталогов веб-сервера или из журналов доступа. Чтобы использовать этот скрипт:</font></p>   <ul>  <li><font size="-1">Вы должны уметь подключаться и запускать скрипты на Вашем веб-сервере. </font></li>  <li><font size="-1">На Вашем веб-сервере должен быть установлен Python 2.2 или более поздней версии. </font></li>  <li><font size="-1">Вам должна быть известна команда, запускающая Python. (Обычно это <strong>python</strong>, однако она может изменяться при установке . Например, если на веб-сервере установлены две версии Python, более раннюю версию можно вызвать с помощью команды <strong>python</strong>, а более позднюю версию — с помощью команды <strong>python2</strong>.) </font></li>  <li><font size="-1">Необходимо знать путь к каталогу на Вашем сайте. Если на Вашем веб-сервере размещен только один сайт, может использоваться следующий путь: <strong>var/www/html</strong>. Если имеется виртуальный сервер, на котором размещено несколько сайтов, путь может быть следующим: <strong>home/virtual/site1/fst/var/www/html</strong>. </font></li>  <li><font size="-1"> Вы должны уметь загружать файлы на свой веб-сервер (например, с помощью FTP). </font></li>  <li><font size="-1">Если Вы будете создавать список URL на основе журналов доступа, необходимо знать кодировку, используемую для этих журналов, и полный путь к ним. </font></li>  </ul>   <p><font size="-1">При наличии сомнений можно обратиться с эти вопросом в компанию веб-хостинга. </font></p>  <font size="-1">  <p>Теперь Вы готовы начать работу. Здесь приведен обзор действий, которые Вам необходимо выполнить.</p>  </font>  <font size="-1">  <ol>  <li><font size="-1"><a href="#download">Загрузите</a> файлы программы Sitemap Generator. Извлеките эти файлы в локальный каталог. </font></li>  <li><font size="-1"><a href="#config">Создайте файл конфигурации</a> для Вашего сайта, используя имеющийся файл <strong>example_config.xml</strong> в качестве шаблона. Измените этот файл в соответствии с Вашими задачами и сохраните его. </font></li>  <li><font size="-1"><a href="#copy">Загрузите нужные файлы на</a> Ваш веб-сервер. </font></li>  <li><font size="-1"><a href="#execute">Запустите</a> <strong>sitemap_gen.py</strong>. </font></li>  <li><font size="-1"><a href="http://www.google.com/support/webmasters/bin/answer.py?answer=34575&topic=8496">Добавьте</a> созданный файл Sitemap в свою учетную запись Google для веб-мастеров. </font></li>  <li><font size="-1"><a href="#recur">Настройте повторяющийся скрипт</a>. (необязательно) </font></li>  </ol>  </font>   <p><font size="-1">Если нет возможности использовать Sitemap Generator, можно добавить файл Sitemap в учетную запись веб-мастера в <a href="http://www.google.com/support/webmasters/bin/answer.py?answer=34606&topic=8516">другом формате</a>, включая простой текстовый файл. Ссылки на некоторые программы независимых производителей, поддерживающие Google Sitemaps, можно найти <a href="http://code.google.com/sm_thirdparty.html">здесь</a>.</font></p>  <table border="0" cellpadding="2" cellspacing="0" width="100%">  <tbody><tr>  <td style="border-top: 1px solid rgb(221, 173, 8); background-color: rgb(254, 250, 222);"><a name="download"></a><b>1. Загрузка файлов программы Sitemap Generator</b></td>  </tr>  </tbody></table>  <font size="-1">  <p>Файлы Sitemap Generator в форматах архивов ZIP и GZ доступны <font size="-1">в следующем местоположении:</font></p>  </font>  <p><font size="-1"><a href="http://www.sourceforge.net/project/showfiles.php?group_id=137793&amp;package_id=153422">http://sourceforge.net/project/showfiles.php?group_id=137793&amp;package_id=153422</a></font></p>  <font size="-1">  <p>После загрузки данного архива извлеките его в локальный каталог. Найдите следующие файлы:</p>  <ul>  <li><strong> README</strong> &#8212;содержит последнюю информацию об этом инструменте</li>  <li><strong> sitemap_gen.py</strong> —скрипт на языке Python, который создает Ваш Sitemap</li>  <li><strong> example_config.xml</strong> —шаблон файла конфигурации, который Вы используете для задания конфигурации для Вашего сайта.</li>  <li><strong> example_urllist.txt</strong> —шаблон списка URL, который можно использовать при необходимости создания Sitemap на основе указанного Вами набора URL.</li>  </ul>  </font>  <table border="0" cellpadding="2" cellspacing="0" width="100%">  <tbody><tr>  <td style="border-top: 1px solid rgb(221, 173, 8); background-color: rgb(254, 250, 222);"><a name="config"></a><b>2a. Создание файла конфигурации</b></td>  </tr>  </tbody></table>  <font size="-1">  </font><p><font size="-1">В этом разделе приведены детальные инструкции для создания файла конфигурации. Кроме того, в нем содержится <a href="#config_reference">полная справка</a> по доступным параметрам. Если Вы создаете <a href="http://www.google.com/support/webmasters/bin/answer.py?answer=34627&topic=8493">Sitemap для мобильных устройств</a>, см. <a href="#creating_mobile">дополнительные руководства для мобильных устройств</a>. </font></p>  <font size="-1"><p>Для создания файла конфигурации для своего сайта Вам необходимо иметь следующую информацию:</p>  <ul>  <li>Базовый URL для Вашего сайта (например, <strong>http://www.example.com</strong>/). Убедитесь, что Вы включили протокол (например, <strong>http://</strong>). Например, <strong>http://www.google.com</strong> является допустимым базовым url, а <strong>www.google.com</strong> — нет.</li>   
<li>Путь на веб-сервере к местоположению, где необходимо сохранить этот Sitemap. Обычно, это путь к базовому URL, так как Sitemap не может содержать URL, которые относятся к каталогу более высокого уровня по отношению к местоположению данного Sitemap. Когда Вы запускаете Google Sitemap Generator, он создает Sitemap и помещает его в указанное Вами местоположение.</li>   <li>Методы, которые должен использовать Sitemap Generator для создания Вашего Sitemap. Вы можете использовать любую комбинацию методов. Доступны следующие методы:</li>  </ul>   </font><ol> <ul>  <li><font size="-1"><strong> <a href="#URL">URL</a></strong> —укажите отдельные URL в этом разделе файла конфигурации наряду с информацией о каждом из URL. Обычно Вы будете использовать этот метод совместно с другим методом для включения дополнительных URL, которые не будут выбираться другими методами, вручную. </font></li>  <li><font size="-1"><strong><a href="#urllist">Список URL</a> </strong> —в файлe конфигурации укажите путь к текстовому файлу, содержащему список URL. Использование этого метода может потребоваться в том случае, если этот текстовый файл уже существует или если Вы используете скрипт для создания списка URL. </font></li>  <li><font size="-1"><strong><a href="#directory">Пути к каталогам</a></strong> &#8212;укажите пути к каталогам для Вашего сайта и соответствующие URL для этих путей. Sitemap Generator создаст список URL на основе содержания этих каталогов. Это метод может использоваться в том случае, если Ваш сайт включает статические файлы HTML. </font></li>  <li><font size="-1"><strong> <a href="#logs">Журналы доступа</a></strong> —укажите путь к Вашим журнальным файлам. Sitemap Generator создаст список URL на основе URL, включенных в эти журналы. Использование этого метода может потребоваться в том случае, если Ваш сайт включает динамические страницы. </font></li>  <li><font size="-1"><strong> <a href="#sitemap">Sitemap</a></strong> &#8212;указывает существующие Sitemaps, которые были созданы с помощью Sitemap Generator. Sitemap Generator создает единый Sitemap, который включает URL, входящие в каждый Sitemap. Вы можете использовать этот метод, если уже создали несколько небольших Sitemaps, которые нужно объединить в один Sitemap большего размера. </font></li>  </ul>  </ol>   <font size="-1"><p><b><a name="create_config"></a>Создайте файл конфигурации следующим образом:</b></p>  </font>  <ol>  <font size="-1"> <li>Откройте файл <strong>example_config.xml</strong> в текстовом редакторе. Сохраните его как новый файл (например, <strong>config.xml</strong> или <strong>mysite_config.xml</strong>).</li>  </font>    <font size="-1">  <li>Найдите раздел определения сайта:</li>  </font>   <pre>&lt;site 
base_url="http://www.example.com/" 
store_into="/var/www/docroot/sitemap.xml.gz"
verbose="1"&gt;</pre>   <font size="-1"><li>Измените значение <strong>base_url</strong> на URL для Вашего сайта.</li>   <li>Измените значение <strong>store_into</strong> на путь на Вашем веб-сервере, где необходимо сохранить данный Sitemap и имя файла, которое Вы хотите использовать для него. Обычно это путь к базовому URL, так как Google может принимать только URL, которые находятся на том же уровне, что и каталог или подкаталоги каталога, в котором размещен этот Sitemap. Вы можете указать относительный путь от каталога, в который загружен скрипт, или полный путь от корневого каталога на Вашем веб-сервере. Если Вы загрузили скрипт в каталог базового URL, можно просто указать имя этого файла.</li>  </font>  <font size="-1"></font><font size="-1"><li>Найдите разделы методов создания, которые начинаются с <span class="style1">** MODIFY</span> <span class="style1">or DELETE **</span>. Каждый из этих разделов соответствует определенному методу для создания Sitemap.</li>  <li>Удалите эти разделы для методов, которые Вы не собираетесь использовать.</li>  <li>Следуйте приведенным ниже инструкциям для методов, которые Вы собираетесь использовать.</li>  <p><strong> URL<a name="URL"></a></strong></p>  <p>Найдите следующий раздел:</p>  </font>  <pre>&lt;!-- ** MODIFY or DELETE ** 
"url" nodes specify individual URLs to include in the map. &lt;br&gt;

Required attributes: 
href - the URL

Optional attributes: 
lastmod - timestamp of last modification (ISO8601 format) 
changefreq - how often content at this URL is usually updated
priority - value 0.0 to 1.0 of relative importance in your site 
--&gt; 

&lt;url href="http://www.example.com/stats?q=name" /&gt; 
&lt;url 
href="http://www.example.com/stats?q=age" 
lastmod="2004-11-14T01:00:00-07:00" 
changefreq="yearly" 
priority="0.3"
/&gt;</pre>  <font size="-1">  <p>В этом разделе приведено два примера. первый включает только обязательный атрибут, а второй содержит также необязательные атрибуты.</p>  <p>Используйте этот формат для каждого URL, который хотите включить. Атрибут <strong>changefreq</strong> дает Google общее представление о частоте обновления этого URL.  Он помогает Google узнать о том, как часто следует проверять на этой странице наличие нового содержания. Атрибут <strong>priority</strong> предоставляет Google информацию об относительной важности этой страницы по сравнению с другими страницами на Вашем сайте. Этот атрибут не влияет на то, как Google сравнивает Вашу страницу со страницами на других сайтах, он только позволяет Google узнать, какие страницы на этом сайте наиболее важны по Вашему мнению.</p>  </font>  <p><font size="-1"><strong> Список URL <a name="urllist"></a> </strong></font></p>  <font size="-1"><p>Найдите следующий раздел:</p>   </font>  <pre>&lt;!-- ** MODIFY or DELETE **
"urllist" nodes name text files with lists of URLs. 
An example file "example_urllist.txt" is provided. 

Required attributes: 
path - path to the file 

Optional attributes: 
encoding - encoding of the file if not US-ASCII 
--&gt; 
&lt;urllist path="example_urllist.txt" encoding="UTF-8" /&gt;</pre>   <p><font size="-1"> Используйте этот формат для указания пути и имени для текстового файла, содержащего список URL. Вы можете использовать имеющийся файл <strong>example_urllist.txt </strong> в качестве шаблона для этого текстового файла. Вы можете указать относительный или полный путь к Вашему веб-серверу. Например, если Sitemap Generator и файл <strong>urlist.txt </strong> расположены в одном каталоге, Вы можете просто указать имя файла в формате<strong> .txt</strong>. Если Вы создаете текстовый файл с кодировкой, отличной от UTF-8, Вы можете использовать атрибут <strong>encoding</strong> для обозначения этой кодировки. Если у Вас несколько файлов .txt, можно использовать подстановочные знаки. Например:</font></p>  <pre>&lt;urllist path=&quot;example_urllist*.txt&quot; encoding=&quot;UTF-8&quot; /&gt;</pre>  <p><font size="-1">Для каждого URL, который Вы включаете в текстовый файл, можно указать дату последнего изменения, частоту изменения и приоритет. См. в <a href="#urllist_reference">справочном разделе для текстовых файлов списков URL</a> полную информацию о структуре этого файла.</font></p>  <p><font size="-1"><strong> Пути к каталогам<a name="directory"></a> </strong></font></p>  <p><font size="-1"> Найдите следующий раздел: </font></p>   <pre>&lt;!-- ** MODIFY or DELETE ** 
"directory" nodes tell the script to walk the file system and 
include all files and directories in the Sitemap.

Required attributes:
path - path to begin walking from 
url - URL equivalent of that path 

Optional attributes:
default_file - name of the index or default file for directory URLs

--&gt; 
 &lt;directory  path=&quot;/var/www/icons&quot;    url=&quot;http://www.example.com/images/&quot; /&gt;<br>&lt;directory<br>path=&quot;/var/www/docroot&quot;<br>url=&quot;http://www.example.com/&quot;<br>default_file=&quot;index.html&quot;<br>/&gt;</pre>   <p><font size="-1">В этом разделе приведено два примера. Если все Ваши страницы находятся в подкаталогах одного пути, то необходимо включить только одну запись. Однако, если для страниц на Вашем сайте имеется несколько путей, следует включить запись для каждого из них. </font></p>   <p><font size="-1">Помните, что каждый URL должен начинаться с базового URL, указанного в действии 3. Например, в обоих примерах, приведенных в файле <strong>example_config.xml</strong>, имеются URL, начинающиеся с <strong>http://www.example.com/</strong>. Поэтому оба URL являются допустимыми. </font></p>   <p><font size="-1">Замените примеры записей на записи для Вашего сайта. Для многих сайтов будет только одна запись, указывающая базовый URL. Убедитесь, что значение <strong>path</strong> представляет собой полный путь к каталогу на Вашем веб-сервере. Убедитесь, что значение <strong>url</strong> представляет собой полный URL, включающий протокол (например, http) и концевую косую черту, если она необходима.</font></p>  <p><font size="-1">Вы можете использовать параметр <strong>default_file</strong> для задания имени файла, который Ваш сервер использует как страницу по умолчанию для каталога. В приведенном выше примере <strong>/var/www/docroot</strong> превратился в <strong>http://www.example.com/index.html</strong>. Вам не обязательно это указывать. Однако если Вы это сделаете, Sitemap Generator включит эту страницу, которая отображается в подкаталог только один раз (вместо того, чтобы приводить и URL каталога, и URL имени файла), и будет использовать дату последнего изменения этого файла (а не каталога) для извлечения атрибута lastmod для этой страницы. </font></p>  <p><font size="-1"><strong> Журналы доступа <a name="logs"></a></strong></font></p>  <p><font size="-1"> Найдите следующий раздел: </font></p>  <pre>&lt;!-- ** MODIFY or DELETE **
&quot;accesslog&quot; nodes tell the script to scan webserver log files to
extract URLs on your site.  Both Common Logfile Format (Apache's default 
logfile) and Extended Logfile Format (IIS's default logfile) can be read.
				
Required attributes:
 path - path to the file
Optional attributes:
 encoding - encoding of the file if not US-ASCII
  --&gt;
&lt;accesslog path=&quot;/etc/httpd/logs/access.log&quot; encoding=&quot;UTF-8&quot; /&gt;
&lt;accesslog path=&quot;/etc/httpd/logs/access.log.0&quot; encoding=&quot;UTF-8&quot; /&gt;
&lt;accesslog path=&quot;/etc/httpd/logs/access.log.1.gz&quot; encoding=&quot;UTF-8&quot; /&gt;</pre>   <p><font size="-1">В этом разделе приведено три примера. Необходимо заменить эти записи и включить запись для каждого файла журнала. Убедитесь, что значение path представляет собой полный путь и имя файла на Вашем веб-сервере. Если для файлов журналов не используется кодировка US-ASCII или UTF-8, необходимо использовать необязательный атрибут <strong>encoding</strong> для <a href="#encoding">указания</a> этой кодировки. Вместо перечисления каждого из файлов журналов можно использовать подстановочные знаки. Например, в приведенном выше примере Вы можете использовать следующую запись, включающую все три журнальных файла:</font></p> <pre>&lt;accesslog path=&quot;/etc/httpd/logs/access.log*&quot; encoding=&quot;UTF-8&quot; /&gt;</pre>  <p><font size="-1">Sitemap Generator назначает приоритет для URL, которые он находит в журналах, на основе частоты обращения к каждому URL. Например, URL, к которому обращались 100 раз, будет присвоен более высокий приоритет, чем URL, к которому обращались только дважды. Назначение фактического приоритета относительно и зависит от сравнения каждого URL с другими URL на этом сайте.</font></p> <p><font size="-1"><strong> sitemap <a name="sitemap"></a></strong></font></p> <p><font size="-1"> Найдите следующий раздел: </font></p>  <pre>&lt;!-- ** MODIFY or DELETE **<br>&quot;sitemap&quot; nodes tell the script to scan other Sitemap files. This can
be useful to aggregate the results of multiple runs of this script into
a single Sitemap.

Required attributes:
path - path to the file
--&gt;
&lt;sitemap path=&quot;/var/www/docroot/subpath/sitemap.xml&quot; /&gt;</pre>   <p><font size="-1">В этом разделе приведен один пример. Необходимо заменить эту запись и вставить запись для каждого Sitemap, который нужно включить. Убедитесь, что значение path представляет собой полный путь и имя файла на Вашем веб-сервере. Вы можете также перечислить сжатые архиватором gzip файлы Sitemap, если они имеют расширение .gz. Вместо перечисления каждого Sitemap можно использовать подстановочные знаки. Например, следующая запись будет включать все Sitemaps, начинающиеся со слова &quot;sitemap&quot; и имеющие расширение .xml:</font></p> <pre>&lt;sitemap path=&quot;/var/www/docroot/subpath/sitemap*.xml&quot; /&gt;</pre>  <p><font size="-1">Sitemap Generator извлекает все URL и дополнительные данные, приведенные для каждого URL, для каждого перечисленного Вами Sitemap, и создает один Sitemap, включающий эту информацию. В настоящее время мы не можем гарантировать, что этот метод будет работать для Sitemaps, созданных с помощью других средств, отличных от Sitemap Generator.</font></p>     <font size="-1"><li>Найдите раздел определения фильтра:</li></font>   <pre>&lt;!-- ********************************************************         
FILTERS
				
Filters specify wild-card patterns that the script compares
against all URLs it finds. Filters can be used to exclude
certain URLs from your Sitemap, for instance if you have
hidden content that you hope the search engines don't find.

Filters can be either type=&quot;wildcard&quot;, which means standard
path wildcards (* and ?) are used to compare against URLs,
 or type=&quot;regexp&quot;, which means regular expressions are used
to compare.

Filters are applied in the order specified in this file.
An action=&quot;drop&quot; filter causes exclusion of matching URLs.
An action=&quot;pass&quot; filter causes inclusion of matching URLs,
shortcutting any other later filters that might also match.
If no filter at all matches a URL, the URL will be included.
Together you can build up fairly complex rules.

The default action is &quot;drop&quot;.
The default type is &quot;wildcard&quot;.

You can MODIFY or DELETE these entries as appropriate for
your site. However, unlike above, the example entries in
this section are not contrived and may be useful to you as
they are.
********************************************************* --&gt;

&lt;!-- Exclude URLs that end with a '~' (IE: emacs backup files) --&gt;
&lt;filter action=&quot;drop&quot; type=&quot;wildcard&quot; pattern=&quot;*~&quot; /&gt;

&lt;!-- Exclude URLs within UNIX-style hidden files or directories --&gt;
&lt;filter action=&quot;drop&quot; type=&quot;regexp&quot; pattern=&quot;/\.[^/]*&quot; /&gt;</pre>  <p><font size="-1">Вы можете использовать фильтрацию для исключения определенных URL из созданных Sitemap. Это может потребоваться для создания отфильтрованного списка, для сокращения избыточных списков или предотвращения индексации определенных URL. Имейте в виду, что если Вы используете файл <a href="http://www.robotstxt.org/wc/robots.html">robots.txt</a> для запрещения индексации определенных URL, то даже в том случае, если эти URL включены в Ваш Sitemap, Google не будет искать и индексировать их. </font></p>   <p><font size="-1"> Вы можете использовать некоторые или все методы фильтрации. Вы можете удалить ненужные записи и создать дополнительные записи, если это необходимо. Ниже приведены примеры использования. </font></p>  <pre>&lt;filter action=&quot;drop&quot; type=&quot;wildcard&quot; pattern=&quot;*.jpg&quot; /&gt;</pre>  <p><font size="-1">Этот фильтр исключает URL, которые оканчиваются на .jpg. Включение этого фильтра может потребоваться в том случае, если все изображения на Вашем сайте внедрены в страницы HTML, и не должно быть отдельных URL для доступа к этим изображениям. </font></p>  <pre>&lt;filter action=&quot;pass&quot; type=&quot;wildcard&quot; pattern=&quot;*.htm*&quot; /&gt;
&lt;filter action=&quot;drop&quot; type=&quot;wildcard&quot; pattern=&quot;*&quot; /&gt;</pre><font size="-1"> Этот фильтр включает все файлы .htm*, но исключает все остальное.</font><br>  <br>    <font size="-1"></font><font size="-1"><li>После выполнения всех изменений для Вашего сайта сохраните этот файл.</li></font>  </ol>    <font size="-1"><a name="config_reference"></a><p><b>Справочные сведения о синтаксисе файла конфигурации</b></p>  </font><font size="-1">  </font>  <p><font size="-1">Каждый тег начинается с примера кода, за которым следует описание атрибутов.</font></p>   <p><font size="-1"><strong><a name="sitetag"></a>site<br></strong></font><font size="-1">Обязательный тег в начале каждого файла конфигурации. </font></p>  <pre>&lt;site
base_url="http://www.example.com/"
store_into="/var/www/html/sitemap.xml.gz"
verbose="1"
supress_search_engine_notify="1"
default_encoding="UTF-8"&gt;</pre>  <br>  <font size="-1">  <table border="1" cellpadding="2" cellspacing="0" width="100%">   <tbody><tr>  <td valign="top" width="19%"><pre>base_url</pre></td>  <td valign="top" width="6%"><font size="-1">обязательный</font></td>  <td valign="top" width="75%"><font size="-1">Путь HTTP для базы на Вашем веб-сайте — только URL, которые начинаются с этой базы, могут включаться в этот Sitemap</font></td>  </tr>   <tr>  <td valign="top"><pre>store_into</pre></td>  <td valign="top"><font size="-1">обязательный</font></td>  <td valign="top"><font size="-1">Путь на веб-сервере к нужному файлу вывода. Этот скрипт создаст данный файл, поэтому не нужно создавать файл перед запуском скрипта.</font></td>  </tr>   <tr>  <td valign="top"><pre>verbose</pre></td>  <td valign="top"><font size="-1">необязательно</font></td>  <td valign="top"><font size="-1">Введите число от 0 до 3, большие числа соответствуют увеличивающейся информации отладки</font></td>  </tr>   <tr>  <td valign="top"><pre>suppress_search_engine_notify</pre></td>  <td valign="top"><font size="-1">необязательно</font></td>  <td valign="top"><font size="-1">О</font><font size="-1">тключите уведомление поисковой системы, введя "1" в целях тестирования</font></td>  </tr>   <tr>  <td valign="top"><pre>default_encoding</pre></td>  <td valign="top"><font size="-1">необязательно</font></td>  <td valign="top"><font size="-1">Укажите кодировку символов для применения к путям файловой системы и URL</font></td>  </tr>   </tbody></table>  </font>  <font size="-1">   <p></p>  </font>  <p><font size="-1"><strong>url<br></strong></font><font size="-1">Необязательный тег, который можно использовать для перечисления каждого URL на Вашем сайте. </font></p>  <p><pre>&lt;url
href="http://www.example.com/stats?q=age" 
lastmod="2004-11-14T01:00:00-07:00" 
changefreq="yearly" 
priority="0.3"
/&gt;</pre></p><table border="1" cellpadding="2" cellspacing="0" width="100%">  <tbody><tr>  <td height="20" valign="top" width="19%"><pre>href</pre></td>  <td width="6%" valign="top"><font size="-1">обязательный</font></td>  <td valign="top" width="75%"><font size="-1">Путь HTTP для базы на Вашем веб-сайте — только URL, которые начинаются с этой базы, могут включаться в этот Sitemap</font></td>  </tr><tr>  <td valign="top"><pre>lastmod</pre></td>  <td valign="top"><font size="-1">необязательно</font></td>  <td valign="top"><font size="-1">Время последнего изменения URL в формате <a href="http://www.w3.org/TR/NOTE-datetime">W3C Datetime</a>   (ГГГГ-ММ-ДДВчч:мм:сс+00:00).  Время можно не указывать. Примеры:<br>&nbsp;&nbsp;"2005-02-21T18:00:15+00:00"<br>&nbsp;&nbsp;"2005-02-21"</font></td>  </tr><tr>  <td valign="top"><pre>changefreq</pre></td>  <td valign="top"><font size="-1">необязательно</font></td>  <td valign="top"><font size="-1">Возможная частота изменения этого URL. Она рассматривается как подсказка, а не команда.  Значение должно быть одним из следующих:  "always" (всегда), "hourly" (ежечасно), "daily" (ежедневно), "weekly" (еженедельно), "monthly" (ежемесячно), "yearly" (ежегодно) или "never" (никогда).</font></td>  </tr><tr>  <td valign="top"><pre>priority</pre></td>  <td valign="top"><font size="-1">необязательно</font></td>  <td valign="top"><font size="-1">Приоритет этой страницы относительно других страниц на этом сайте. Это значение представляет собой число в диапазоне от 0,0 до 1,0, где 0,0 представляет самый низкий приоритет, а 1,0 — самый высокий. Этот приоритет может влиять на порядок выбора URL поисковыми системами для обнаружения на Вашем сайте. Поскольку этот приоритет является относительным, он используется только для выбора между URL на Вашем собственном сайте; приоритет Ваших страниц не будет сравниваться с приоритетом страниц на других сайтах.</font></td>  </tr>  </tbody></table>  <p><font size="-1"><b>urllist<br></b></font><font size="-1">Необязательный тег, который Вы можете использовать для указания текстового файла, содержащего список URL на Вашем сайте. </font></p>  <pre>&lt;urllist path="/var/www/html/urllist.txt" encoding="UTF-8" /&gt;</pre>  <br>  <table border="1" cellpadding="2" cellspacing="0" width="100%">  <tbody><tr>  <td height="20" valign="top" width="19%"><pre>path</pre></td>  <td width="6%" valign="top"><font size="-1">обязательный</font></td>  <td valign="top" width="75%"><font size="-1">путь и имя файла .txt. Вы можете указать относительный или полный путь. </font></td>  </tr><tr>  <td valign="top"><pre>encoding</pre></td>  <td valign="top"><font size="-1">необязательно</font></td>  <td valign="top"><font size="-1">Кодировка для данного файла, если используется не UTF-8.</font></td>  </tr>  </tbody></table> <p><font size="-1"><a name="urllist_reference"></a>Файл <b>urllist.txt</b> — это простой текстовый файл, содержащий список URL для карты. Вы можете также включить необязательные атрибуты для каждого URL. Атрибуты вводятся на той же строке, что и URL, и разделяются одним пробелом.  Например:</font></p>  <pre>http://www.example.com/abc/something
http://www.example.com/abc/xyy.pdf lastmod=2001-12-31T14:05:06+00:00
http://www.example.com/abc/def?x=12&amp;y=23 changefreq=weekly priority=0.3</pre>  <p>  <font size="-1">   </font><table border="1" cellpadding="2" cellspacing="0" width="100%">  <tbody><tr>  <td width="19%" valign="top"><pre>lastmod</pre></td>  <td valign="top" width="6%"><font size="-1">необязательно</font></td>  <td width="75%" valign="top"><p><font size="-1">Время последнего изменения URL в формате <a href="http://www.w3.org/TR/NOTE-datetime">W3C Datetime</a>    (ГГГГ-ММ-ДДВчч:мм:сс+00:00).  Время можно не указывать. Примеры:</font><font size="-1"><br>  <br>&nbsp;&nbsp;"2005-02-21T18:00:15+00:00"<br>&nbsp;&nbsp;"2005-02-21"</font></p>  </td>  </tr><tr>  <td valign="top"><pre>changefreq</pre></td>  <td valign="top"><font size="-1">необязательно</font></td>  <td valign="top"><font size="-1"><font size="-1">Вероятная частота изменения данного URL. Она рассматривается как указание, а не как команда.  Значение должно быть одним из следующих: "always" (всегда), "hourly" (ежечасно), "daily" (ежедневно), "weekly" (еженедельно), "monthly" (ежемесячно), "yearly" (ежегодно) или "never" (никогда).</font></font></td>  </tr><tr>  <td valign="top"><pre>priority</pre></td>  <td valign="top"><font size="-1">необязательно</font></td>  <td valign="top"><font size="-1">Приоритет этой страницы относительно других страниц на этом сайте. Это значение представляет собой число в диапазоне от 0,0 до 1,0, где 0,0 представляет самый низкий приоритет, а 1,0 — самый высокий. Этот приоритет может влиять на порядок выбора URL поисковыми системами для обнаружения на Вашем сайте. Поскольку этот приоритет является относительным, он используется только для выбора между URL на Вашем собственном сайте; приоритет Ваших страниц не будет сравниваться с приоритетом страниц на других сайтах.</font></td>  </tr>  </tbody></table>  </p>  <font size="-1">  </font>  <p><font size="-1"><strong>directory<br></strong></font><font size="-1">Необязательный тег, который Вы можете использовать для указания каталогов на Вашем сайте, чтобы Sitemap Generator мог создать список URL из файлов, найденных в этих каталогах. </font></p>  <pre>--&gt; 
 &lt;directory  path=&quot;/var/www/icons&quot;    url=&quot;http://www.example.com/images/&quot; /&gt;<br>&lt;directory<br>path=&quot;/var/www/docroot&quot;<br>url=&quot;http://www.example.com/&quot;<br>default_file=&quot;index.html&quot;<br>/&gt;</pre>  <table border="1" cellpadding="2" cellspacing="0" width="100%">  <tbody><tr>  <td width="19%" valign="top"><pre>path</pre></td>  <td valign="top" width="6%"><font size="-1">обязательный</font></td>  <td width="75%" valign="top"><font size="-1">Задает начальный путь. Sitemap Generator будет проходить этот каталог и все подкаталоги</font>.</td>  </tr>   <tr>  <td valign="top"><pre>url</pre></td>  <td valign="top"><font size="-1">обязательный</font></td>  <td valign="top"><font size="-1">Задает эквивалент URL для значения path.</font></td>  </tr>  <tr>  <td valign="top"><pre>default_file</pre></td>  <td valign="top"><font size="-1">необязательно</font></td>  <td valign="top"><font size="-1">Задает файл по умолчанию для каталога на данном сервере.</font></td>  </tr>  </tbody></table>  </font>  <p><font size="-1"><b> accesslog<br></b>Необязательный тег, который можно использовать для задания пути и имени файла для журналов доступа Apache и IIS, чтобы Sitemap Generator мог автоматически выбрать из них URL. </font></p>   <pre>&lt;accesslog path="/etc/httpd/logs/access-0.log" encoding="UTF-8"/&gt;</pre>  <table border="1" cellpadding="2" cellspacing="0" width="100%">  <tbody><tr>  <td width="19%" valign="top"><pre>path</pre></td>  <td valign="top" width="6%"><font size="-1">обязательный</font></td>  <td width="75%" valign="top"><font size="-1">Задает путь к файлу.</font></td>  </tr>   <tr>  <td valign="top"><pre>encoding</pre></td>  <td valign="top"><font size="-1">необязательно</font></td>  <td valign="top"><font size="-1">Задает кодировку для данного файла, если используется не UTF-8.</font></td>  </tr>  </tbody></table>    <p><font size="-1"><b> sitemap<br></b>Необязательный тег, который можно использовать для задания пути и имени файла для существующих Sitemaps, которые были созданы с помощью Sitemap Generator. Sitemap Generator создает единый Sitemap, который включает URL из каждого Sitemap. </font></p>   <pre>&lt;sitemap path=&quot;/var/www/docroot/subpath/sitemap.xml&quot; /&gt;</pre>  <table border="1" cellpadding="2" cellspacing="0" width="100%">  <tbody><tr>  <td width="19%" valign="top"><pre>path</pre></td>  <td valign="top" width="6%"><font size="-1">обязательный</font></td>  <td width="75%" valign="top"><font size="-1">Задает путь к файлу Sitemap.</font></td>  </tr>  </tbody></table>    <p><font size="-1"><strong><a name="filter_examples"></a>filter<br></strong></font><font size="-1">Необязательный тег, который может использоваться для создания правил, которые включают или исключают определенные файлы. Фильтры применяются в том порядке, в котором они появляются в файле config.xml. Однако смешивание записей фильтров и входных записей (url, urllist, directory или accesslog) не дает дополнительного эффекта — каждый URL, который Sitemap Generator добавляет в Sitemap, сначала сравнивается с каждым из фильтров. </font><font size="-1">Если URL не соответствует ни одному из фильтров, по умолчанию этот URL включается в Sitemap.</font></p>   <pre>&lt;filter action="drop" type="wildcard" pattern="*/internal/*" /&gt;</pre>  <table border="1" cellpadding="2" cellspacing="0" width="100%">  <tbody><tr>  <td width="19%" valign="top"><pre>action</pre></td>  <td valign="top" width="6%"><font size="-1">необязательно</font></td>  <td width="75%" valign="top">  <font size="-1"><p>Действие, которое должен выполнять фильтр. Допустимые значения:</p>  </font> <ul>  <li><font size="-1">drop — исключает соответствующие URL. Это действие по умолчанию, поэтому если никаких действий не задано, этот генератор предполагает &quot;drop&quot;.</font></li>  <li><font size="-1">pass — включает соответствующие URL.</font></li>  </ul>  </p></td>  </tr>   <tr>  <td width="19%" valign="top"><pre>type</pre></td>  <td valign="top" width="6%"><font size="-1">необязательно</font></td>  <td width="75%" valign="top"><font size="-1"><p>Тип фильтрации. Допустимые значения:</p>  </font> <ul>  <li><font size="-1">wildcard — стандартные подстановочные знаки для пути (? и *) используются для сравнения с URL. Это тип по умолчанию, поэтому если тип не указан, генератор предполагает &quot;wildcard&quot;.</font></li>  <li><font size="-1">regexp — используются регулярные выражения.</font></li>  </ul></td>  </tr>  <tr>  <td valign="top"><pre>pattern</pre></td>  <td valign="top"><font size="-1">обязательный</font></td>  <td valign="top"><font size="-1">Указывает образец для сравнения.</font></td>  </tr>  </tbody></table>  <font size="-1"> <p><b><a name="encoding"></a>Кодировки</b></p>   <p>В файлах, указанных в Вашем файле конфигурации, списках URL или журналах веб-сервера, может использоваться кодировка, отличная от стандартной кодировки UTF-8. Можно указать альтернативные кодировки в config.xml, чтобы повлиять на принцип чтения этих файлов Sitemap Generator. Некоторые основные кодировки:</p>  <ul>  <li><strong>encoding="utf-8"</strong> предполагается по умолчанию</li><li><strong>encoding="ascii</strong>" является подмножеством UTF-8, поэтому Вам не нужно ее определять</li><li><strong>encoding="iso-8859-1</strong>" является общей для многих западноевропейских языков</li></ul>  </font>   <table border="0" cellpadding="2" cellspacing="0" width="100%">  <tbody><tr>  <td style="border-top: 1px solid rgb(221, 173, 8); background-color: rgb(254, 250, 222);"><a name="creating_mobile" id="creating_mobile"></a><b>2b. Дополнительная информация для создания файла конфигурации для мобильных устройств</b></td>  </tr>  </tbody></table>  <p><font size="-1">Вы  можете создать файл конфигурации для Sitemap для мобильных устройств так же, как и для обычного Sitemap. Однако Вы должны создать отдельный файл конфигурации для каждого языка разметки и запустить Sitemap Generator с каждым файлом конфигурации отдельно для создания отдельного Sitemap для каждого языка.</font></p>  <p><font size="-1">Каждый файл конфигурации должен:</font></p>  <ul>  <li><font size="-1">Укажите другое имя файла для значения <a href="#create_config"><strong>store_into</strong> </a>.</font></li>  <li><font size="-1">Используйте <a href="#filter_examples">фильтры</a>, чтобы указать URL для исключения и включения для данного языка разметки. Учитывайте, что каждый Sitemap должен включать URL только для одного языка разметки. Это означает, что одни и те же URL могут быть включены в несколько Sitemap, если это URL с несколькими языками разметки для мобильных устройств.</font></li>  </ul>  <p><strong><font size="-1">Примеры фильтрации</font></strong></p>  <p><font size="-1">В приведенных ниже примерах показано, как Вы можете использовать основанные на расширениях фильтры для создания Sitemap для мобильных устройств для различных языков разметки. Используемая Вами фильтрация должна быть основана на типах языков разметки, используемых на Вашем сайте, и способе указания каждого типа. Если Вы реализовывали элементы своего сайта по-разному (например, Вы можете организовать URL с различными языками разметки в отдельных папках), фильтрация должна быть основана на специфике реализации Вашего сайта. Следует учитывать, что фильтры применяются в том порядке, в котором они указаны в файле конфигурации. Так, первый фильтр должен соответствовать действию "pass", которое указывает URL, которые Вы хотите включить в Sitemap. </font></p>  <p><font size="-1">Для создания Sitemap для содержания WML (WAP 1.2):</font></p>   <pre>&lt;filter action="pass" type="wildcard" pattern="*.wml" /&gt;
&lt;filter action="drop" type="wildcard" pattern="*.*" /&gt;<br>
</pre>   <p><font size="-1">Для создания Sitemap для содержания в формате мобильного профиля XHTML (WAP 2.0):</font></p>   <pre>&lt;filter action="pass" type="wildcard" pattern="*.xhtml" /&gt;
&lt;filter action="drop" type="wildcard" pattern="*.*" /&gt;<br>
			</pre>  <table border="0" cellpadding="2" cellspacing="0" width="100%">  <tbody><tr>  <td style="border-top: 1px solid rgb(221, 173, 8); background-color: rgb(254, 250, 222);"><a name="copy"></a><b>3. Загрузка файлов на Ваш веб-сервер</b></td>  </tr>  </tbody></table>  <p><font size="-1"> Необходимо загрузить следующие файлы на Ваш веб-сервер в местоположение, к которому можно перейти из командной строки: </font></p>   <font size="-1"><ul>  <li><strong> config.xml</strong> &#8212;это файл конфигурации, только что созданный Вами с помощью <strong>example_config.xml</strong>.</li>  <li><strong> sitemap_gen.py</strong> —это скрипт на языке Python, который создает Ваш Sitemap.</li>  <li><strong> urllist.txt</strong> &#8212;этот файл является необязательным; Вам необходимо включать его только в том случае, если Вы используете текстовый файл для создания Sitemap.</li>  </ul>   </font>  <p><font size="-1"> Применяемый для загрузки этих файлов метод зависит от используемой среды. Основные методы включают <a href="http://www.google.com/search?q=ftp">FTP</a> и SCP. Для получения дополнительной информации обращайтесь в Вашу компанию веб-хостинга. </font></p>   <table border="0" cellpadding="2" cellspacing="0" width="100%">  <tbody><tr>  <td style="border-top: 1px solid rgb(221, 173, 8); background-color: rgb(254, 250, 222);"><a name="execute"></a><strong>4. Запуск скрипта Sitemap Generator (sitemap_gen.py) </strong></td>  </tr>  </tbody></table>   <p><font size="-1"> Для запуска Sitemap Generator необходимо подключиться к своему веб-серверу. Используемый для подключения метод зависит от среды. Например, обычно для доступа к серверу UNIX используется <a href="http://www.google.com/search?q=ssh">SSH</a>. Для получения дополнительной информации о подключении к веб-серверу и запуске скриптов обратитесь в компанию веб-хостинга. </font></p>   <p><font size="-1"> После копирования этих файлов на Ваш веб-сервер Вам необходимо запустить скрипт Sitemap Generator. Подключитесь к Вашему веб-серверу и выполните следующую команду (замените <strong>&lt;path/config.xml&gt;</strong> на путь и имя файла для Вашего файла конфигурации; если Вы загрузили этот файл в тот же каталог, где находится скрипт на языке Python, путь можно исключить):</font></p>   <pre>python sitemap_gen.py --config=&lt;path/config.xml&gt</pre> <p><font size="-1">Например, командная строка на основе UNIX может выглядеть следующим образом:</font></p> <p><img src="images/python_command.gif" alt="Команда Python"></p> <p><font size="-1">Командная строка на основе MS-DOS может выглядеть следующим образом:</font></p> <p><img src="images/python_dos.gif" alt="Команда Python"></p> <p><font size="-1"><b>Совет:</b> Если Вы проверяете конфигурацию и не готовы отправить свой Sitemap, с помощью следующего синтаксиса можно предотвратить обращение Sitemap Generator в Google:</font></p>  <pre><br>$ python sitemap_gen.py --config=config.xml --тестирование</pre>  <font size="-1"><p>Вы увидите статус Вашего запроса в командной строке:</p></font> <pre>Reading configuration file: /path/config.xml
	Opened URLLIST "/path/urllist.txt"
	Walking DIRECTORY "/var/www/html/dir"
	Walking DIRECTORY "/var/www/html/dir2"
	Opened ACCESSLOG "/etc/httpd/logs/access-0.log"
	Sorting and normalizing collected URLs.
	Writing Sitemap file "/path/sitemap.xml.gz" with 1092 URLs
	Notifying search engines.
	Notifying www.google.com
	Count of file extensions on URLs:
		208  .html
		574  .jpg
		...
		Number of errors: 0
		Number of warnings: 0</pre>  <font size="-1">  <p>Если Вы видите меньше результатов, чем здесь, учтите, что параметр verbose в Вашем файле конфигурации влияет на количество отображаемой на экране информации. В этом примере для параметра verbose было установлено значение "1".</p>  <p>Также будут возвращены все ошибки в этом файле. Например, если Вы оставили атрибут url= без записи каталога, скрипт выведет следующее:</p></font> <pre>[ERROR] Directory entries must have both "path" and "url" attributes
	Number of errors: 1</pre>  <font size="-1">  </font>  <p><font size="-1">Исправьте все ошибки в Вашем файле <b>config.xml</b> и повторно запустите скрипт. Если ошибки отсутствуют, Sitemap Generator создаст новый файл <b>sitemap.xml.gz</b> в местоположении, указанном в файле конфигурации. </font></p>  <table border="0" cellpadding="2" cellspacing="0" width="100%">  <tbody><tr>  <td style="border-top: 1px solid rgb(221, 173, 8); background-color: rgb(254, 250, 222);"><a name="submitting" id="submitting"></a><strong>5. Отправка Вашего Sitemap в Google </strong></td>  </tr>  </tbody></table>  <p><font size="-1">Sitemap Generator создает файл <strong>sitemap.xml.gz</strong> в каталоге, указанном в файле конфигурации. Создав файл, убедитесь, что к нему можно получить доступ через веб-сервер. Затем <a href="http://www.google.com/support/webmasters/bin/answer.py?answer=34575&topic=8496">добавьте</a> его в свою учетную запись<a href="https://www.google.com/webmasters/sitemaps/siteoverview">Google Sitemaps</a>. Это позволит Google предоставить Вам полезные сведения о статусе и статистике. Если Google сообщил об ошибках в Вашем файле Sitemap, можно их исправить и повторно передать файл. Этот файл Sitemap необходимо добавить вручную только один раз. После этого можно пользоваться <a href="submit.html#ping">запросом HTTP</a>, чтобы сообщать Google об изменениях (хотя можно также и передать файл повторно через учетную запись веб-мастера Google). </font></p>   <table border="0" cellpadding="2" cellspacing="0" width="100%">  <tbody><tr>  <td style="border-top: 1px solid rgb(221, 173, 8); background-color: rgb(254, 250, 222);"><a name="recur"></a><b>6. Настройка повторяющегося скрипта</b></td>  </tr>  </tbody></table>  <font size="-1">  <p>Мы рекомендуем настроить запуск Sitemap Generator с той частотой, с которой изменяется содержание Вашего сайта, до максимальной частоты — раз в час.</p>  </font>  <p><font size="-1">Веб-мастера, использующие веб-сервер UNIX, могут рассмотреть возможность настройки этой операции как <a href="http://www.google.com/search?q=cron">задания хрон</a>. </font></p>  <font size="-1"><p>Веб-мастера, использующие другие платформы, должны обратиться к системным администраторам за помощью в настройке повторяющихся скриптов. Кроме того, полезно просмотреть советы в группе Google Sitemaps в службе <a href="http://www.google.com/webmasters/sitemaps/googlegroup?hl=ru">Группы Google</a>.</p>   </font>  <p><font size="-1">Сообщить Google об изменениях в своем файле Sitemap можно с помощью <a href="submit.html#ping">запроса HTTP</a>. Однако не забудьте хотя бы один раз войти в <a href="https://www.google.com/webmasters/sitemaps/siteoverview">инструменты Google для веб-мастеров</a> с использованием учетной записи Google и <a href="http://www.google.com/support/webmasters/bin/answer.py?answer=34575&topic=8496">отправить свой файл Sitemap</a> в Google вручную.</font></p>  <font size="-1"></font>  <table border="0" cellpadding="2" cellspacing="0" width="100%">  <tbody><tr>  <td style="border-top: 1px solid rgb(221, 173, 8); background-color: rgb(254, 250, 222);"><a name="troubleshoot"></a><b>Разрешение проблем</b></td>  </tr>  </tbody></table>  <font size="-1">  <p>В этом разделе мы обсуждаем некоторые общие вопросы или проблемы, с которыми сталкиваются некоторые пользователи при использовании Sitemap Generator, и возможные пути их решения.</p>  <p><b>Доступно в Интернет</b></p>  <p><b>Проблема:</b> Sitemap Generator возвращает следующую ошибку и предупреждение:</p>  </font> <pre>[ERROR] When attempting to access your generated Sitemap at the following URL:
	http://www.example.com/sitemap.xml.gz
	we failed to read it.  Please verify the store_into path you specified in
	your configuration file is web-accessible.  Consult the FAQ for more
	information.
	[WARNING] Proceeding to notify with an unverifiable URL.</pre>  <font size="-1">  <p><b>Что случилось?</b> Sitemap Generator создал файл в указанном Вами месте, однако при попытке извлечь его, используя HTTP, как это бы сделала поисковая система, не смог этого сделать. Как бы то ни было, он продолжал действовать и уведомил поисковые системы, но вывел ошибку и предупреждение для сообщения Вам о том, что Ваш Sitemap не может быть прочитан поисковыми системами.</p>  <p>Sitemap Generator создает Ваш файл Sitemap в каталоге, указанном в атрибуте store_into Вашего файла <b>config.xml</b>.  Sitemap Generator затем создает URL для этого файла, используя атрибут base_url, и сообщает этот URL поисковым системам.  Например, если Вы задали конфигурацию для:</p>  </font> <pre>&lt;site base_url="http://www.example.com/"
	      store_into="/var/www/html/sitemap.xml.gz"&gt;</pre>  <font size="-1">  </font><p><font size="-1">Sitemap Generator уведомит поисковые системы о том, что Ваш Sitemap находится в:</font></p>   <pre>http://www.example.com/sitemap.xml.gz</pre>  <font size="-1"><p>Этот файл должен быть доступен при использовании данного URL. Если этот файл нельзя извлечь с помощью данного URL, поисковые системы не смогут найти Ваш Sitemap.</p>  </font><p><font size="-1"><b>Что можно сделать?</b> Вам необходимо убедиться, что Ваш <b>config.xml</b> указывает правильные пути base_url и store_into для Вашего Sitemap. Кроме того, Вам необходимо подтвердить, что браузеры могут извлечь файл Sitemap для base_url. Если Вы обнаружили ошибки в пути или URL, можно повторно запустить Sitemap Generator или же только переместить файл Sitemap в нужное место и уведомить поисковые системы вручную с помощью их веб-сайтов.  </font></p>  <font size="-1"><p><b>Поддержка для XML</b></p>  <p><strong>Проблема:</strong> Sitemap Generator выдает следующую ошибку:</p>  </font> <pre>Some installs of Python 2.2 do not include complete support for XML. 
	Please try upgrading your version of Python and re-running the script.</pre>  <font size="-1"><p><b>Что случилось?</b> Как указывается в этом сообщении, некоторые платформы включают версию Python (язык, на котором написан скрипт Sitemap Generator), которая не поддерживает библиотеки, необходимые для обработки файлов XML. Для зaпуска этого зaпуска требуется полная поддержка XML.</p>  <p><b>Что можно сделать?</b> Попробуйте выполнить обновление установленной версии Python на более новую.  Для этого Вам может потребоваться обратиться к системному администратору.</p>  <p>Следует иметь в виду, что он влияет только на Sitemaps Generator, а не на все Sitemaps. Если у Вас имеется другой метод или инструмент для создания файлов Sitemaps, Вы несомненно можете использовать его и отправлять свои файлы Sitemaps в поисковые системы.</p>  <p><b>Что представляют собой все дополнительные файлы в архиве .gz или .zip?</b></p>  <p>Когда Вы извлечете сценарий sitemap_gen.py, Вы , наверное, увидите намного больше файлов, чем упомянуто выше. Полный список файлов будет выглядеть примерно так:</p>  </font>  <pre>AUTHORS
	ChangeLog
	COPYING
	example_config.xml
	example_urllist.txt
	PKG-INFO
	README
	setup.py
	sitemap_gen.py
	test_sitemap_gen.py</pre>  <font size="-1"><p>Дополнительные файлы обычно содержат информацию об условиях лицензирования и предоставления пакетов.  Вам предлагается ознакомиться с этими файлами.</p>  <p>Единственное исключение — test_sitemap_gen.py, который является скриптом для тестирования элементов и может оказаться полезным другим разработчикам, если они захотят внести вклад в этот открытый проект. Если Вы собираетесь использовать Sitemap Generator без изменения исходного кода — а это ожидаемый вариант практически для всех — то Вам, вероятно, не потребуется этот скрипт.</p>Если Вы заинтересованы в помощи по этому проекту, см. <a href="http://sourceforge.net/projects/goog-sitemapgen">http://sourceforge.net/projects/goog-sitemapgen</a>. <a href="http://code.google.com/sm_thirdparty.html">Здесь </a> Вы можете также найти ссылки на некоторые сторонние программы, поддерживающие Google Sitemaps.</p>   <font size="-1"></font></font>  <p><font size="-1"><b><a name="nonascii"></a>Символы, отличные от ASCII </b></font></p>  <font size="-1"><font size="-1">  </font></font>  <p><font size="-1"><strong>Проблема.</strong> Имя домена Вашего сайта или его URL содержит отличные от ASCII символы.</font>.</p>  <p><font size="-1">Обычно URL, содержащие символы, отличные от ASCII, должны <a href="protocol.html#escaped">кодироваться с использованием UTF-8</a> перед маскированием знака процента. Однако некоторые веб-серверы должным образом отвечают только в том случае, если для URL используется отличная от UTF-8 кодировка. Для всех URL в Вашем Sitemap, включая URL самого Sitemap, должна использоваться соответствующая кодировка для удобочитаемости веб-сервером, на котором они размещаются. В <a href="#sitetag">разделе определения site </a> используйте необязательный атрибут <strong>default_encoding</strong> для определения кодировки, используемой Вашим веб-сервером. Если Вы не используете этот тег и Ваш веб-сервер использует кодировку, отличную от UTF-8, мы не сможем узнать, какую кодировку использовать.</font></p>  <p><font size="-1">Если Ваши URL включают символы, отличные от ASCII - рекомендуется запустить скрипт Sitemap Generator, используя Python 2.3 или более новой версии. В этой версии Python добавлена поддержка символов, отличных от ASCII. Если Ваше имя домена содержит отличные от ASCII символы, необходимо использовать Python 2.3 или более новой версии, поскольку в более ранних версиях отсутствует поддержка Internationalizing Domain Names in Applications (IDNA). Без поддержки IDNA Sitemap Generator не сможет правильно закодировать имя домена, включающее отличные от ASCII символы. </font></p>  <font size="-1">     <br>  <p class="d" align="right"><i>Последнее изменение: 15 апреля 2006 года</i></p>  </font></div>  </td>  </tr>  <tr>  <td width="1%" valign="top"><img src="http://www.google.com/images/art.gif" width="143" height="53" vspace="5" hspace="15"></td>  <td style="background-color: #ffffff" width="1" valign="top"><img src="http://www.google.com/images/cleardot.gif" width="1" height="1"></td>  <td style="background-color: #ffffff" width="10" valign="top"><img src="http://www.google.com/images/cleardot.gif" width="1" height="1"></td>  <td valign="middle"><div class="footer">  <div align="center"><font size="-1"> &copy;2007 Google — <a href="http://www.google.com/privacy.html">Конфиденциальность и безопасность</a> — <a href="http://www.google.com/accounts/TOS">Общие положения и условия</a> — <a href="http://www.google.com/about.html">О Google</a> </font></div>  </div></td>  </tr> </table> </body> </html>  